iT邦幫忙

2023 iThome 鐵人賽

DAY 14
0
SideProject30

python基礎及數據科學之應用系列 第 14

python基礎及數據科學之應用day 14[Statistics模組]

  • 分享至 

  • xImage
  •  

Day 14:
今天説的Python statistics比較複雜,那麼便開始吧。

/images/emoticon/emoticon18.gif

什麼是Python statistics

statistics模組適用於數字資料序列,例如列表、元組或其他可迭代物件。

下載statistics模組

pip install statistics

平均值

import statistics


exam_score = [100,78,45,66,33,77,13,99,56,49,96]

mean_value = statistics.mean(exam_score)
print("Mean score = ", int(mean_value))

執行結果:

Mean score =  64

numpy 眾數

什麼是眾數
[3, 5, 2, 5, 1, 4, 9, 5]
在該集合中,值 5 出現的頻率最高,出現了 3 次。因此,該集合的眾數為5。

例子:

import statistics

score = [88,76,66,77,88,88,45,22,56,88,59,90,100,96]

mode_value = statistics.mode(score)
print("Mode :", mode_value)

執行結果:

Mode : 88

中位數

例子:

import statistics

data = [4, 2, 9, 5, 1, 8, 7, 6, 3]

median_value = statistics.median(data)

print("Median:", median_value)

執行結果:

Median: 5

變異數

什麼是變異數

變異數是統計學中用於衡量數據集的離散程度的指標。它描述了數據點相對於其的離散程度。可以用來判斷數據集的擴散程度或數據點與禮儀之間的差異程度。

標準差可用於比較不同資料集之間的變異性。透過比較兩個或多個資料集的標準差,您可以評估哪個資料集的值分佈較大或較小。這種比較有助於理解資料集的相對變異性和分佈特徵。

公式

https://ithelp.ithome.com.tw/upload/images/20230929/20163173U0tI9PljvY.png

變異數在統計學和數據分析中非常重要,它可以提供有關數據分佈的有用信息,例如數據的離散程度、可靠性和可比性等。透過計算和分析變異數,可以讓我們更好地理解資料集的特徵和變異情況,從而做出更準確的統計推論和預測。

例子:

import statistics

data = [2, 4, 6, 8, 10]

population_variance = statistics.pvariance(data)
print("Population Variance:", population_variance)

執行結果:

Population Variance: 8

標準差

什麼是標準差

標準差 (Standard Deviation) 是一個用於量化一組數據點的散佈或變異程度的統計指標。它衡量每個數據值與該數據集的平均值之間的平均距離。

標準差用處

1.識別異常值:標準差可以用於檢測異常值。一般來說,與平均值相差超過一定數量的標準差的數據點可以視為異常值。通過識別和處理異常值,可以獲得更準確和可靠的數據分析結果。

2.評估風險:在金融和投資領域,標準差被用作度量風險的指標。標準差越大,表示投資回報的波動性越高,風險也相對較高。它有助於評估投資項目的風險水平,並支持風險管理和決策制定。

公式

https://ithelp.ithome.com.tw/upload/images/20230929/20163173eeMps4NaHb.png

例子:

import statistics

data = [1, 2, 3, 4, 6, 7]

# 計算標準差
std_dev = statistics.stdev(data)
print("標準差:", std_dev)

執行結果:

>>標準差: 2.3166067138525404

相關係數

什麼是相關係數

相關係數(correlation coefficient)是用於衡量兩個變量之間關係的統計量。在Python中,您可以使用不同的庫來計算相關係數,包括statistics模塊和NumPy庫。

相關係數用處:

相關係數可用於評估一個變量對另一個變量的預測能力。如果兩個變量之間的相關係數較高,則可以使用一個變量來預測另一個變量的值。例如,在金融領域,相關係數可用於評估股票價格和相關指數之間的關聯性,以預測未來的股票價格變動。

公式

https://ithelp.ithome.com.tw/upload/images/20230929/20163173mKzItdVNIw.png

例子:

import statistics

data = [1, 2, 3, 4, 5]

variance_value = statistics.variance(data)
print("方差:", variance_value)

執行結果:

>>方差: 2.5

/images/emoticon/emoticon30.gif
今天的內容有點無聊,如果覺得我的文章對你有幫助或有更好的建議,可以追蹤我和不妨在留言區提出,我們明天再見。

reference:
https://www.geeksforgeeks.org/variance/
https://www.google.com/url?sa=i&url=https%3A%2F%2Fwww.oanda.com%2Fbvi-ft%2Flab-education%2Ftechnical_analysis%2Fwhat_is_bollinger_band%2F&psig=AOvVaw39EIDem97sDUok_gQ7XUB3&ust=1696061473040000&source=images&cd=vfe&opi=89978449&ved=0CBIQ3YkBahcKEwjQuazDr8-BAxUAAAAAHQAAAAAQEQ
https://chih-sheng-huang821.medium.com/%E7%9B%B8%E9%97%9C%E4%BF%82%E6%95%B8%E8%88%87%E5%85%B1%E8%AE%8A%E7%95%B0%E6%95%B8-correlation-coefficient-and-covariance-c9324c5cf679


上一篇
python基礎及數據科學之應用day 13[寶可夢大師pvp資料(csv)讀取]
下一篇
python基礎及數據科學之應用day 15[sympy模組]
系列文
python基礎及數據科學之應用30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言